2025.10.30 | 看图写码7B逆袭；视频思维RL破局

Update: 2025-10-30

Description

本期的 15 篇论文如下：

[00:22 ] 👁 JanusCoder: Towards a Foundational Visual-Programmatic Interface for Code Intelligence（JanusCoder：面向代码智能的基础视觉-编程接口）

[01:00 ] 🧠 Video-Thinker: Sparking "Thinking with Videos" via Reinforcement Learning（Video-Thinker：用强化学习点燃“视频思维”）

[01:55 ] 🔄 ReForm: Reflective Autoformalization with Prospective Bounded Sequence Optimization（ReForm：基于前瞻性有界序列优化的反思式自动化形式化）

[02:42 ] 🔄 Scaling Latent Reasoning via Looped Language Models（通过循环语言模型扩展潜在推理能力）

[03:22 ] 🧠 Reasoning-Aware GRPO using Process Mining（基于过程挖掘的推理感知GRPO方法）

[03:52 ] 🎬 VFXMaster: Unlocking Dynamic Visual Effect Generation via In-Context Learning（VFXMaster：通过上下文学习解锁动态视觉特效生成）

[04:33 ] 🏆 The Tool Decathlon: Benchmarking Language Agents for Diverse, Realistic, and Long-Horizon Task Execution（工具十项全能：面向多样、真实、长周期任务的语言智能体基准测试）

[05:11 ] 🖼 RegionE: Adaptive Region-Aware Generation for Efficient Image Editing（RegionE：面向高效图像编辑的自适应区域感知生成）

[06:22 ] 🎮 ChronoPlay: A Framework for Modeling Dual Dynamics and Authenticity in Game RAG Benchmarks（ChronoPlay：面向游戏RAG评测的双动态与真实性建模框架）

[06:58 ] 🧭 Multimodal Spatial Reasoning in the Large Model Era: A Survey and Benchmarks（大模型时代的多模态空间推理：综述与基准）

[07:44 ] 🔗 PairUni: Pairwise Training for Unified Multimodal Language Models（PairUni：面向统一多模态语言模型的成对训练）

[08:33 ] ⚡ Parallel Loop Transformer for Efficient Test-Time Computation Scaling（并行循环Transformer：零延迟的测试时计算扩展）

[09:08 ] 🚗 Rethinking Driving World Model as Synthetic Data Generator for Perception Tasks（重新审视驾驶世界模型：面向感知任务的合成数据生成器）

[09:55 ] 🧬 ODesign: A World Model for Biomolecular Interaction Design（ODesign：面向生物分子相互作用设计的全原子生成式世界模型）

[10:31 ] 🧬 Evolving Diagnostic Agents in a Virtual Clinical Environment（虚拟临床环境中进化诊断智能体）

</figure>

【关注我们】

您还可以在以下平台找到我们，获得播客内容以外更多信息

小红书: AI速递

Comments

In Channel

【周末特辑】11月第1周最火AI论文 | 循环模型省参强推理；Concerto 2D-3D自监督涨点

2025-11-0111:53

2025.10.31 | Emu3.5统一预测时空；扩散提示驱动机器人

2025-10-3110:09

2025.10.30 | 看图写码7B逆袭；视频思维RL破局

2025-10-3011:29

2025.10.29 | 通义深度研究报告；小模型折记忆胜671B巨模型

2025-10-2908:14

2025.10.28 | Point Transformer无标对齐长空间；代码递归统一粗细粒度

2025-10-2811:05

2025.10.27 | DeepAgent一步推理+ToolPO；视频即提示DiT秒控百种语义

2025-10-2710:29

【周末特辑】10月第4周最火AI论文 | 内部概率+投票剪尾，RPC省样本提精度

2025-10-2613:26

2025.10.24 | AdaSPEC挑40% token提速两成；AutoPage 10美分生成交互网页

2025-10-2410:39

2025.10.23 | 线性注意力显存降十倍；动态裁剪PPO稳提分

2025-10-2310:46

2025.10.22 | LightMem压缩记忆千倍提速12倍；闭环世界模型微调8万数据反超巨兽

2025-10-2211:14

2025.10.21 | 模型不懂光影折射；小模型也能写报告

2025-10-2110:06

2025.10.20 | RPC剪枝提速保准；OmniVinci小数据跨模态称王

2025-10-2011:11

【周末特辑】10月第3周最火AI论文 | 量化噪声变探索，单卡跑RL；冻结编码器放语义，DiT生成新纪录

2025-10-1813:30

2025.10.17 | AI眼镜预判式服务；视频生成补想象力

2025-10-1708:40

2025.10.16 | UniMoE一统语音音乐；注意力图点亮大模型推理

2025-10-1610:13

2025.10.15 | 像素级自监督ViT刷新生成基准；多智能体评测网文翻译新标尺

2025-10-1510:38

2025.10.14 | 量化误差变奖励，单卡训32B；面向多模态大模型的音视频评测基准

2025-10-1411:24

2025.10.13 | 桌面交互预训练解锁机器人潜能；统一模型赋予相机空间想象力

2025-10-1310:10

【周末特辑】10月第2周最火AI论文 | 递归小模型刷爆推理榜；未来经验点亮零奖励学习

2025-10-1211:39

2025.10.10 | 早期经验的Agent Learning；图文交错反思链跃升至24.9%

2025-10-1010:00

00:00

2025.10.30 | 看图写码7B逆袭；视频思维RL破局

#box-pro-ellipsis-17621065425005{-webkit-line-clamp:2;}2025.10.30 | 看图写码7B逆袭；视频思维RL破局

2025.10.30 | 看图写码7B逆袭；视频思维RL破局

2025.10.30 | 看图写码7B逆袭；视频思维RL破局